Introducción a los Agentes de Resolución de Problemas

Del Reflejo a la Planificación

En la evolución del diseño de agentes, pasamos de Agentes Reactivos, que mapean las percepciones directamente a acciones basadas en reglas simples (por ejemplo, “Si el coche de delante frena, iniciar frenado”), a Agentes de Resolución de Problemas. Los agentes reactivos operan con el contexto inmediato, mientras que los agentes de resolución de problemas están orientados a Objetivos. Consideran las consecuencias futuras de sus acciones para encontrar una secuencia que satisfaga un objetivo específico.

Agente Reactivo: $Acción = Función(Percepción)$
Agente de Planificación: $Secuencia\_de\_Acciones = Búsqueda(Estado, Objetivo)$

La Representación de Estado Atómico

A este nivel fundamental, los agentes utilizan una Representación Atómica. Esto significa que el estado del mundo se trata como una caja negra: un nodo singular sin estructura interna visible para el algoritmo de búsqueda. El agente solo razona sobre:

Estados ($S$): Instantáneas del entorno.
Acciones ($A$): Transiciones entre estados.
Prueba de Objetivo: Una comprobación booleana si el estado $s \in S_{objetivo}$.

El Bucle de Resolución de Problemas

Un agente de resolución de problemas sigue un ciclo distintivo de cuatro pasos para navegar por el entorno:

Formulación del Objetivo: Decidir qué objetivo perseguir basándose en la situación actual.
Formulación del Problema: Abstraer el mundo real en un modelo matemático (Estados y Acciones).
Búsqueda: Simular secuencias de acciones para encontrar el camino óptimo.
Ejecución: Realizar las acciones encontradas durante la fase de búsqueda sin más deliberación (asumiendo un entorno estático).

Implementación en Python (agent_types.py)

class ReflexAgent:
defact( self, percept):
# Mapeo directo: Regla -> Acción
return rules.get(percept, default_action)
class ProblemSolvingAgent:
def__init__( self):
self.seq = [] # Secuencia de acciones en búfer
defact( self, percept):
# Si estamos en medio de la ejecución, continuamos
ifself.seq:
returnself.seq.pop( 0 )
# De lo contrario, Planificar (Buscar)
        state = self.update_state(percept)
        goal = self.formulate_goal(state)
        problem = self.formulate_problem(state, goal)
# La búsqueda devuelve una lista de acciones
self.seq = search_algorithm(problem)
returnself.seq.pop( 0 )